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Resumo 


Breve revisão sobre os tipos de dados e as diferentes escalas de mensuração. Obje- 
tiva explicar a confusão semântica entre os nomes e conceitos utilizados utilizados 
para dados e escalas em estatística descritiva e análise exploratória de dados. 
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1 A confusão (eterna!) dos tipos de dados 


Seja você um estatístico, um analista de negócios ou um cientista de dados, é óbvio 
que essa entidade, o dado (seja lá o que isso quer dizer), é parte central do seu 
trabalho. 

Com certeza você já percebeu que existem dados que representam a descrição 
de uma qualidade (ex.: sexo, religião) e dados que representam uma quantidade 
numérica (ex.: idade, altura). 

Também já percebeu que alguns dados são descritivos mas têm uma certa or- 
denação intrínseca (ex.: “analfabeto”, “1º grau completo”, “2º grau completo”, 
“superior completo”), enquanto outros são descritivos e não têm nenhuma orde- 
nação intrínseca (ex.: “vermelho”, “verde”, “amarelo”). 

Essa diversidade de tipos de dados cria uma dificuldade para o analista!: existem 
técnicas de estatística descritiva e inferencial que podem ser mais mais ou menos 
adequadas dependendo do tipo de dado considerado. Obviamente você não pode 
calcular a média entre “vermelho”, “verde” e “amarelo”2. 

Ao se deparar com um conjunto de dados para análise, uma das primeiras pre- 
ocupações do analista é então verificar claramente qual é o tipo, a natureza do dado 
de cada variável que será analisada. Isso é necessário para determinar quais técni- 
cas gráficas e estatísticas são mais adequadas. E aqui existe uma enorme e eterna 
confusão semântica: a nomenclatura utilizada pelos diversos autores é um verda- 
deiro “faroeste” onde todos atiram contra todos e salve-se quem puder (LIND; 
MARCHAL; WATHEN, 2012; TRIOLA, 1998; FEINSTEIN, 1987; BERQUÓ; 
SOUZA; GOTLIEB, 1981; FEINSTEIN, 1985; ZAR, 1999; FEINSTEIN, 1996; 
SOARES; SIQUEIRA, 2002; LAURENTI et al., 1987; KLEINBAUM et al., 1997; 
ARMITAGE; BERRY; MATTHEWS, 2002; MOSTELLER; TUKEY, 1977). 

Alguns autores dividem os dados em quantitativos e qualitativos; outros pre- 
ferem dividir em nominais, ordinais, discretos e contínuos; alguns incluem dados 
binários como uma categoria separada, outros consideram que dados binários são 
um tipo de dado ordinal; uns consideram nominal como sinônimo de qualitativo 
enquanto outros defendem que dados nominais são um subtipo dos dados qualita- 
tivos; outros separam os dados numéricos em intervalares e de razão, enfim... a 
confusão semântica é grande. 

À situação fica ainda mais confusa quando se considera a nomenclatura utilizada 
pelos softwares de análise de dados, por exemplo: o R (R Core Team, 2021) classifica 
alguns dados em “fatores”, para uso durante as as análises. Mas o que é um “fator”? 
Só quem usa a Linguagem R sabe o significado desse tipo de dado. 





!Vou usar a palavra “analista” para designar qualquer pessoa que trabalhe com análise de dados, seja 
ela um estatístico, um matemático, um cientista de dados, um cientista etc. 

?Pelo menos de modo direto. Podemos tantar um truque inteligente: ao invés de considerar as cores 
diretamente por seus nomes (vermelho, verde e amarelo) podemos tentar considerar as cores por seus 
valores RGB e trabalhar com esses dados numéricos. O problema é saber se isso faz algum sentido! Para 
saber mais sobre o modelo de cores RGB, consulte Wikipedia contributors (2021). 


E por que existe essa confusão toda? Não tenho uma resposta definitiva mas 
acredito que a bagunça semântica ocorra pela mistura entre dois conceitos intima- 
mente relacionados mas distintos: o tipo de dado e a escala de mensuração. 

Obviamente o meu entendimento de tipo de dado e de escala de mensuração 
pode ser diferente do seu entendimento portanto, nas próximas seções, discutirei 
isso em detalhes, começando pela irrelevância da classificação dos dados do ponto 
de vista da natureza. 


2 A natureza não liga para nossas classificações 


Altura é um dado quantitativo? Peso é um dado contínuo? Quantidade de fumo 
consumido por dia é um dado discreto? Fé é um dado qualitativo? A resposta para 
essas perguntas é um surpreendente “não”. A natureza não liga, não dá a mínima 
para como nós resolvemos classificá-la. A natureza é o que é, e não é nada mais além 
disso. 

Vamos entender isso com calma. Considere o exemplo do peso? de uma pessoa. 
O peso de uma pessoa é uma variável quantitativa contínua? Não! O peso de uma 
pessoa é apenas um atributo físico que estamos investigando e que, na verdade, foi 
“inventado” por nós. A natureza não liga se uma pessoa tem ou não tem peso, uma 
pessoa é uma pessoa e pronto. Nós é que temos a necessidade de medir a natureza 
para tentar entender e dar significado ao que encontramos no mundo, e entender 
porque existem variações (existem pessoas desde muito magras até muito gordas). 

É essa vontade, essa necessidade, de dar um sentido à ordem natural das coisas 
que nos levou a “inventar” atributos para classificar e entender a natureza. Nós 
precisamos entender porque existem pessoas muito magras e muito gordas, preci- 
samos de uma forma de medir isso; essa necessidade nos levou a considerar o peso 
como um atributo natural a ser mensurado e entendido. Por isso estamos sempre 
“inventando” novas e engenhosas maneiras de classificar e medir a natureza. 

Agora pense no seguinte: como os antigos gregos mensuravam o peso de alguém 
ou de alguma coisa? Certamente eles não conheciam o quilograma mas deveriam 
ter algum tipo de padrão para pesar objetos. E os índios do Brasil na época do des- 
cobrimento? Eles eram menos desenvolvidos do que os gregos antigos e, mesmo 
assim, tinham a noção de peso. Como os índios lidavam com o peso? Como nós, 
hoje em dia, podemos medir o peso de alguém? 

Considere os seguintes procedimentos para medir o peso de uma pessoa: 


1. Vou olhar para a pessoa e, subjetivamente, classificá-la em “magra”, “nor- 
mal” ou “gorda”. Esse é um procedimento de medição absolutamente vá- 
lido (embora não muito reprodutível nem preciso). Eu simplesmente medi o 
atributo peso usando uma escala subjetiva com três possibilidades; 





30 correto seria utilizar o termo massa mas aqui, de modo informal, vou manter o termo utilizado no 
dia a dia: peso. 


2. Eu também poderia utilizar o procedimento anterior com uma escala subje- 
tiva diferente, com apenas duas possibilidades, “normal” e “alterado”. Isso 
também é um procedimento de medição válido (embora continue não sendo 
reprodutível ou preciso); 


3. Eu também posso utilizar uma balança e medir o peso como 70,3 kg; ou 


4. Eu posso utilizar a balança e comparar o peso obtido com uma classificação já 
estabelecida e apenas regitrar: “Magreza grau III”, “Magreza grau II”, “Ma- 
» 


greza grau 1”, “Adequado”, “Pré-obeso”, “Obesidade grau 1”, “Obesidade 
grau I[” e “Obesidade grau IV”. 


Agora considere os procedimentos de mensuração do peso de uma pessoa lis- 
tados acima. Todos os procedimentos mediram o peso mas forneceram respostas 
diferentes. Na 12 opção o peso foi registrado em três opções que variavem de ma- 
gro a gordo; na 2º opção o peso foi registrado com apenas duas opções; na 3º opção 
o peso poderia ter sido registrado em “infinitas” opções (dependendo do grau de 
precisão da balança); e na 42 opção o peso foi registrado em uma escala com oito 
opções, desde “magreza grau III” até “obesidade grau II”. 

Perceba então que o peso não é, por si mesmo, uma variável contínua... o peso 
pode ser medido de modo válido usando-se diversos procedimentos e escalas arbi- 
trárias de mensuração. Lembre-se: a natureza não liga para o que o peso de fato é, 
nós é que definimos como obteremos os dados (utilizando procedimentos e escalas 
de medição arbitrárias) a respeito do peso de uma pessoa ou alguma coisa. 

Por isso no começo desta seção eu afirmei que a altura não é um dado quantita- 
tivo, nem que o número de cigarros é um dado discreto: isso dependerá do que, de 
fato, queremos medir, do processo medição que podemos utilizar e das escalas de 
mensuração que vamos utilizar. 

Antes de entrarmos diretamente nessa discussão sobre tipos de dados e escalas 
de mensuração penso ser importante esclarecer o significado de alguns termos uti- 
lizados com fregiiência, como medir, medição, mensurar e outros. Isso é o assunto 
da próxima seção. 


3 Sopa de palavras: medir, medição, mensura- 
ção, medida, mensurar, dados... 


Sem querer entrar em discussões semânticas intermináveis”, é importante deixar 
claro o significado de alguns termos comumente utilizados quando falamos em me- 
dir alguma coisa, pois são utilizados vários termos e isso causa uma certa confusão 





*Pegue dois bons dicionários, como o Aurélio (FERREIRA, 2010) e o Houaiss (HOUAISS; VILLAR, 
2009), e tente entender o significado de medir, medida, medição, mensurar e mensuração; você verá a 
confusão semântica existente. E se você incluir os livros de estatística, verá que a confusão semântica é 
maior ainda! 


(ainda mais quando incluímos na lista termos em inglês como measurement, mensu- 
raton ou quantification). Meu entendimento prático” dessa sopa de palavras é ilus- 
trado nos quadros a seguir. 


Medir (sinônimo: mensurar; em inglês: measure) 


É obter (determinar, verificar, avaliar) os dados de um atributo, da exten- 


são ou da grandeza de algo, utilizando um instrumento (utensílio, processo) 
baseado em uma escala de expressão padronizada. 





Se eu quero medir a altura de uma pessoa eu estou querendo, de fato, obter 
um dado que represente esse atributo de interesse e, para isso, preciso utilizar um 
instrumento ou processo que tenha uma escala de mensuração adequada aos meus 
objetivos e que possa ser aplicada à altura, por exemplo: uma trena graduada em 
centímetros. 

Note que nada me obriga a usar uma trena graduada em centímetros: se eu tiver 
um bastão de madeira com três faixas coloridas onde vermelho é baixo, amarelo é 
médio, e verde é alto, também posso medir a altura dessa pessoa (estou usando 
outro instrumento e outra escala de mensuração). 


Medição (sinônimo: mensuração; em inglês: mensuration, measurement) 


E o ato de medir, ou seja, é o ato de obter os dados necessários através da 
conversão de uma entidade observada em uma sentença descritiva. 





Voltando ao exemplo onde eu quero medir a altura de uma pessoa: quando eu 
utilizo uma trena graduada em centímetros e concluo “185 cm”, eu estou reali- 
zando uma medição, ou seja: estou transformando uma entidade observada (no 
caso a altura) em uma sentença descritiva (185; note que o “cm” não faz parte 
do resultado, eu já estou medindo em centímetros: minha escala já é “altura em 
centímetros”). 


Dado (em inglês: data) 


E a sentença descritiva resultante de um processo de mensuração. 





De volta ao exemplo da altura: após realizar a medição eu “converti” a enti- 
dade observada (altura em centímetros) na sentença descritiva 185. Essa sentença 





*Por “prático” quero dizer que talvez as definições que escrevi não sejam as melhores possíveis. Se eu 
pensar mais a fundo e raciocinar por mais alguns meses, talvez consiga escrever uma definição mais geral 
e correta. Mas, para todos os efeitos práticos, a definição que eu escrevi está de bom tamanho. Sinta-se à 
vontade para melhorá-la! 

éA questão de qual escala é melhor será tratada mais adiante. 


descritiva que resulta de um processo de mensuração é o que chamamos de dado 
(SILVA FILHO, 2003)”. 

Observação: os dicionários trazem o termo medida como um sinônimo para 
medição /mensuração. Eu não vou brigar com nenhum dicionarista mas, para mim, 
usar medida como sinônimo de medição /mensuração não é ideal e causa confusão. 
Desse modo, na prática, considero que medida refere-se ao resultado do processo 
de medição /mensuração, ou seja, a medida refere-se ao dado obtido. 

Feita essa digressão, voltarei ao assunto principal deste texto. A Seção 4 dis- 
cute a questão dos tipos de dados (qualitativos e quantitativos) e a Seção 5 discute a 
questão das escalas de mensuração. A Seção 7 discute o relacionamento entre esses 
dois conceitos. 


4 Tipos de dados 


A classificação mais comum dos tipos de dados é separar dois grandes grupos, da- 
dos qualitativos e dados quantitativos, sendo que os dados quantitativos ainda são 
subdivididos em discretos e contínuos: 


Figura 1: Tipos de dados 
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Os dados do tipo qualitativo refletem uma qualidade ou atributo que não pode 
ser expresso numericamente, por exemplo: sexo, religião, cor, estado civil, nacio- 
nalidade, comida preferida, tipo de sistema operacional, Código de Endereçamento 
Postal (CEP) etc. 

Sempre que lidamos com dados não numéricos estamos lidando com dados qua- 
litativos, mesmo que eles tenham sido registrados através de códigos numéricos, 





7 <https://www .abrantes.pro.br/wp-content /uploads/2021/04/0 que e dado.pdf> 


por exemplo: ao registrar o sexo dos participantes de uma pesquisa você pode regis- 
trar 1 para masculino e 2 para feminimo; mesmo que o registro tenha sido numérico 
os dados são qualitativos. 

Alguns autores chamam os dados qualitativos de categóricos e eu concordo 
que esse é um sinônimo válido. Já outros autores também consideram como sinô- 
nimo de qualitativo a palavra “nominal”. Eu penso que isso é temerário pois causa 
confusão desnecessária com uma escala de mensuração (Seção 5). Minha recomen- 
dação aqui é simples: não use nominal como sinônimo de qualitativo. Use somente 
qualitativo (preferível) ou categórico (aceitável). Você vai entender o porquê dessa 
recomendação quando ler as próximas seções. 

Já os dados do tipo quantitativo refletem alguma característica numérica, por 
exemplo: peso em quilogramas, altura em centímetros, número de cigarros fuma- 
dos por dia, saldo bancário em reais, número de filhos menores de dezoito anos, 
temperatura em graus Celsius etc. Os dados quantitativos são subdivididos em: 


e Discretos: são obtidos por contagens e só podem assumir um conjunto li- 
mitado (ou ilimitado mas enumerável) de valores, por exemplo: número de 
mulheres no curso de ciência da computação, número de carros que atraves- 
sam a Terceira Ponte em um dia, número de doses de vacinas aplicadas na 
população brasileira etc. Note que os dados quantitativos discretos só podem 
assumir valores inteiros (0, 1, 2,3,...); não há como contarmos o número de 
cachorros em uma casa e obter 2,58 cachorros; 


e Contínuos: são obtidos por mensurações/medições e podem assumir um nú- 
mero infinito de valores, por exemplo: a altura de uma pessoa em centíme- 
tros. Dependendo da precisão do instrumento de medida, a altura pode ser: 
185cm, 185,6 cm, 185,63cm, 185,638 cm, 185,6381 cm, 185,63814cm, 
185,638149...cm. Note que os dados contínuos podem assumir qualquer 
valor do conjunto de números reais (R) e, por isso, podem assumir um nú- 
mero infinito de valores”. 


E quanto aos outros “tipos de dados” que aparecem na literatura, como os da- 
dos nominais e ordinais? Bem... não existem esses tipos de dados, esses termos 
denotam diferentes escalas de mensuração, discutidos na próxima seção. 


5 Escalas de mensuração 


Uma outra maneira de encarar a questão dos dados é pensar não no tipo de dado 
em si mas, sim, nas escalas que podemos utilizar para medir as coisas. Em mea- 
dos da década de 1940, Stanley Smith Stevens publicou um artigo seminal a res- 
peito do tema (STEVENS, 1946) que impactou e influenciou grandemente a área 





“Embora, em algumas situações específicas, não seja interessante registrar mais algarismos significa- 
tivos do que você realmente precisa. Consulte Silva Filho (2021) para uma discussão sobre algarismos 
significativos. 


de estatística. Nesse artigo Stevens estabeleceu uma hierarquia de quatro escalas 
de mensuração (nominal, ordinal, intervalar e razão) e descreveu que tipos de 
procedimentos estatísticos (descritivos e inferenciais) e gráficos poderiam ser utili- 
zados para dados expressos em cada uma dessas escalas (criando assim uma espécie 
de “guia” para orientar o trabalho de análise). Essa hierarquia foi tão impactante 
que diversos livros famosos de estatística a adotaram e influenciaram o pensamento 
de gerações de estatísticos desde então (VELLEMAN; WILKINSON, 1993). 

A diferença básica entre as escalas de mensuração é a possibilidade das cate- 
gorias adjacentes na escala serem ordenadas de modo monotonicamente crescente 
ou decrescente. A escala nominal não pode ser ordenada, mas as escalas ordinal, 
intervalar e razão podem: 


Figura 2: Escalas de mensuração 








A escala é ordenada? 
Sim 











Vamos entender agora a diferença entre essas escalas. 


5.1 Escala nominal 


Na escala de mensuração nominal as categorias da escala não podem ser monoto- 
nicamente ordenadas. O jeito mais fácil de compreender isso é com um exemplo. 


Considere que estamos interessados em averiguar a religião de um grupo de pes- 
soas. Nossa escala de medida tem as seguintes categorias possíveis: 


e Cristianismo 
e Islamismo 

e Hinduísmo 
e Budismo 

e Judaísmo 

e Espiritismo 
* Outra 

e Nenhuma 


Note que não é possível ordenar as categorias da escala, não faz sentido dizer que 
“cristianismo” é maior do que “budismo”. Não existe uma ordenação intrínseca 
entre as categorias adjacentes da escala, não é possível estabelecer nenhuma relação 
de ordem. 

Você poderia ser tentado a ordená-las de modo crescente ou decrescente pelo 
número de praticantes de cada religião, mas isso não é uma ordenação da religião 
em si, é apenas a ordenação do número de fiéis de cada uma. Isso não é a mesma 
coisa que dizer que Budismo é “maior” que Espiritismo por si mesmos. 

Se as categorias da escala de mensuração não tiverem uma ordenação intrín- 
seca, natural, estamos no nível nominal de mensuração. Você pode até codificar 
as categorias de religão com números (1 para cristianismo, 2 para islamismo etc.) 
mas não tem sentido nenhum realizar certos cálculos estatísticos com esses núme- 
ros (média, mediana, desvio padrão etc.) pois eles estão apenas representando de 
modo mais prático o nome de cada religião. 

Alguns outros exemplos de variáveis que podem ser mensuradas em escala no- 
minal: tipo sangiiíneo, CEP, sexo, raça, cor dos olhos, time de futebol, estado civil 
etc. 

Quando temos dados em escala nominal, não podemos calcular média, medi- 
ana nem medidas de variabilidade, já que não há nenhuma ordenação. Entretanto 
podemos verificar a categoria que mais ocorre (a moda) e contar a quantidade de 
observações em cada categoria e expressar essa contagem de modo absoluto ou re- 
lativo em uma distribuição de frequências. 

Nenhuma operação aritmética pode ser realizada com esses dados, exceto ve- 
rificar se alguma observação pertence a alguma categoria e verificar a igualdade ou 
desigualdade entre observações (por exemplo: verificar se a religião do indivíduo 
“A? é igual ou diferente da religião do indivíduo “B”). 

Dados em escala nominal podem ser exibidos graficamente, por exemplo, atra- 
vés de gráficos de pizza, gráfico de barras ou gráficos de Pareto. 

Note que mesmo que a possibilidade analítica de dados em escala nominal seja 
menor por si mesma, esses dados são importantes em diversos tipos de análises 
pois nos permitem buscar diferenças entre categorias. Por exemplo: a hipertensão 
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arterial é mais comum em alguma etnia do que em outra? Pessoas casadas vivem 
mais ou menos do que pessoas solteiras? 


5.2 Escala ordinal 


O próximo nível na hierarquia de Stevens é a escala de mensuração ordinal. Aqui 
as categorias da escala podem ser monotonicamente ordenadas, mas o intervalo 
entre duas categorias adjacentes da escala é arbitrário e não pode ser medido (e 
portanto, não podemos afirmar que esse intervalo seja o mesmo se considerarmos 
outras duas categorias adjacentes da escala). 

Note que as categorias das escalas ordinais apresentam uma ordenação intrín- 
seca, natural, mas não temos como medir qual o intervalo entre uma categoria e 
outra. Considere, como exemplo, a seguinte escala para o grau de escolaridade de 
uma pessoa: 


e Analfabeto 

e Ensino fundamental completo 
e Ensino médio completo 

e Superior completo 

e Mestrado completo 

e Doutorado completo 

e Pós-doutorado completo 


Obviamente existe uma ordenação natural entre as categorias da escala: uma 
pessoa com o ensino superior completo tem maior escolaridade do que uma pessoa 
com somente o ensino médio completo. O problema é que não temos como medir a 
diferença de escolaridade entre as categorias dessa escala: a diferença entre ensino 
fundamental e ensino médio é a mesma do que entre mestrado e doutorado? 

Se as categorias da escala de mensuração tiverem uma ordenação intrínseca, na- 
tural, mas o intervalo entre as categorias adjacentes for arbitrário e não mensurável, 
estamos no nível ordinal de mensuração. Novamente, podemos codificar com nú- 
meros as categorias, para facilitar o registro, mas não tem nenhum sentido realizar 
certos cálculos com esses números (média, desvio padrão etc.). 

Alguns exemplos de variáveis que podem ser mensuradas em escalas ordinais: 
escolaridade, intensidade de dor, classe sócio-econômica, grau de satisfação, faixa 
de renda, qualidade do atendimento etc. 

Quado temos dados em escala ordinal não podemos calcular a média mas pode- 
mos obter a mediana e a moda. Não podemos calcular variância ou desvio padrão, 
mas podemos, de certo modo, verificar a amplitude e os quantis. Também podemos 
contar a quatidade de observações em cada categoria e expressar essa contagem de 
modo absoluta ou relativo em uma distribuição de frequencias. 

Nenhuma operação aritmética pode ser feita com esses dados, mas podemos 
verificar se alguma observação pertenca a alguma categoria, verificar a igualdade 


q 


ou desigualdade entre observações, e realizar comparações do tipo “maior que” ou 
“menor que”. 

Dados em escala ordinal podem ser exibidos graficamente, por exemplo, através 
de gráficos de pizza, gráfico de barras ou gráficos de Pareto. 


5.2.1 Escala binária 


Alguns autores diferenciam um tipo especial de escala, a escala binária ou dicotô- 
mica, onde só existem duas categorias possíveis de escolha, por exemplo: 


e Presente (sim) 
e Ausente (não) 


Na verdade as escalas binárias são apenas um tipo especial das escalas ordinais. 
Isso é facilmente verificável se expandirmos as categorias possíveis, por exemplo: 


e Definitivamente presente 

e Provavelmente presente 

e Possivelmente presente 

* Incerto se presente ou ausente 
e Possivelmente ausente 

* Provavelmente ausente 

e Definitivamente ausente 


5.3 Escala intervalar 


O próximo nível na hierarquia de Stevens é a escala de mensuração intervalar. Aqui 
as categorias da escala: 


* Podem ser monotonicamente ordenadas, de forma crescente ou decres- 
cente; 


e O intervalo entre duas categorias adjacentes da escala pode ser mensu- 
rado e é sempre constante, ou seja, o intervalo é sempre igual entre quais- 
quer duas categorias adjacentes da escala (mesmo que o intervalo tenha sido 
criado de modo arbitrário), nós sabemos exatamente qual é esse intervalo; e 


* Não há um ponto 0 (zero) absoluto, natural, ou seja, nessas escalas o ponto 
zero é sempre arbitrado e, portanto, nenhuma proporção faz sentido. 


É mais fácil entender os dados em escala intervalar com o exemplo clássico, a 
temperatura em graus Celsius. Quando o astrônomo sueco Anders Celsius estabe- 
leceu sua escala de temperatura, usou o seguinte processo: considerando 1 atmos- 
fera de pressão, arbitrou que o ponto de ebulição da água seria considerado como 
o valor 100 e o ponto de congelamento da água seria considerado como o valor 0; 
depois dividiu esse intervalo em cem partes iguais, criando a escala centígrada (que 
depois passou a ser conhecida apenas por escala de graus Celsius). Agora note: 
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e À escala de graus Celsius pode ser ordenada, indo de 0ºC até 100ºC; 


e O intervalo entre duas categorias adjacentes da escala pode ser mensurado 
e é sempre constante: o intervalo entre 12ºC e 13ºC é exatamente igual ao 
intervalo entre 78ºC e 79ºC, que é exatamente igual ao intervalo entre 80 “C€ 
e81ºC; 

e À escala não tem um ponto zero absoluto, natural: o valor de 0 ºC foi arbitra- 
riamente definido como a temperatura na qual a água congela. Isso não quer 
dizer que em 0 ºC não há calor (movimento de partículas), só significa que o 
ponto de congelamento foi arbitrariamente escolhido para ser o zero. 


Uma conseqgiiência importante do fato das escalas intervalares não terem um 
zero natural é que nenhuma proporção faz sentido. Por incrível que pareça a tem- 
peratura (o calor) de 20ºC não é o dobro da temperatura de 10ºC; a temperatura 
de 50 ºC não é a metade da temperatura de 100ºC. 

Você pode falar que 20 “C tem o dobro de divisões de escala do que 10ºC, mas 
isso não significa que a temperatura (o calor) seja o dobro. Em escalas intervala- 
res somente operações de adição e subtração têm sentido, operações de divisão e 
multiplicação não têm sentido algum. 

Se a temperatura de 40ºC fosse o dobro da temperatura de 20ºC, isso seria 
refletido em outras escalas de temperatura, como por exemplo a escala de Fahrei- 
nheit, mas isso não ocorre: 20ºC correspondem a 68ºF, e 40ºC correspondem a 
104ºF, ou seja: o que seria o dobro em Celsius não é o dobro em Fahreinheit. Isso 
decorre do fato do zero ser arbitrário. A escala Kelvin de temperatura tem um zero 
natural, absoluto, portanto ela não é uma escala intervalar. 

Alguns exemplos de escalas intervalares: temperatura (Celsius e Fahreinheit), 
localização no plano Cartesiano (a origem pode ser arbitrariamente definida em 
qualquer ponto no plano), pH, escore SAT (200-800), escore de crédito (300-850), 
tamanhos de roupas, tamanhos de sapatos, escore de quociente de inteligência, di- 
reção como ângulo a partir de um ponto, voltagem etc. 

Uma escala intervalar que costuma causar espanto à primeira vista é o tempo. 
Quando começou o tempo? Quanto tempo o tempo tem? Existiu o tempo “zero”? 
O tempo começou com o big-bang ou já existia antes? Perceba que não há um ponto 
zero natural, absoluto, para o tempo, portanto o tempo é medido em uma escala in- 
tervalar: nós é que arbitramos algum tempo “zero”, definimos uma escala de inter- 
valos apropriada (horas, minutos, segundos) e, a partir de então, passamos a contar 
o tempo. Isso significa que as proporções de tempo não fazem sentido, por exem- 
plo: o tempo no ano 2000 representa o dobro de tempo do ano 1000? Esse exemplo 
é análogo ao da temperatura em Celsius. O que se pode dizer com certeza é que, 
se estamos considerando o calendário gregoriano, o ano 2000 tem mil divisões de 
tempo a mais do que o ano 1000, mas não temos como saber se o tempo, o conceito 
do tempo em si, é o dobro. 

Considere agora os calendários Maia, Judaico ou Chinês. Eles contam o tempo 
de modo diferente. Será que o dobro de “tempo” no calendário gregoriano será 
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refletido exatamente no dobro de “tempo” nos outros calendários? Não, pois o 
tempo não tem um zero natural, sua medida é arbitrária. Pense nas horas do dia: 
nós arbitramos um momento no tempo para ser a “hora zero” e depois contamos 
as horas em períodos de 60 minutos (subdivididos em períodos de 60 segundos) em 
um ciclo e, a cada 24 horas, começamos do zero novamente. 

Como nosso calendário foi arbitrado? A história da contagem do tempo é com- 
plexa e muitos calendários diferentes foram utilizados ao longo das eras. Basta pen- 
sar no seguinte: hoje nós estamos no ano 2021 depois de Cristo, ou seja, arbitramos 
o ano de nascimento de Cristo para contar (e já começamos contando do ano 1, nem 
do ano 0, o que dificulta um pouco mais as coisas). Por isso o tempo é medido em 
uma escala intervalar. 

Quando temos dados em escala intervalar já podemos calcular diversas coisas, 
como a média, mediana, moda, variância, desvio-padrão e quantis. Não podemos 
calcular coisas que dependem de razões, como o coeficiente de variação. 

Podemos realizar operações matemáticas de igualdade, desigualdade, compara- 
ções de maior ou menor, e realizar somas e subtrações (mas não podemos calcular 
multiplicações e divisões, pois as proporções não têm sentido). 

Diversos gráficos podem ser utilizados para representar dados em escala inter- 
valar como, por exemplo, o histograma e o gráfico de dispersão. 


5.3.1 Diferenças entre categorias têm zero absoluto 


Se o tempo é medido em uma escala intervalar, é possível afirmar que uma pessoa 
tem o dobro da idade de outra? Nesse caso, sim. Note bem: 


e As proporções diretas entre categorias de uma escala intervalar não têm sen- 
tido, pois o zero é arbitrário; mas 


e As proporções entre diferenças entre categorias têm sentido, pois as dife- 
renças introduzem um zero absoluto não arbitrário. 


Considere a variável “idade em anos completos”. A idade em anos completos é 
calculada como uma diferença entre a data atual e a data de nascimento da pessoa. 
Esse cálculo introduz um zero natural, absoluto, na mensuração: se a pessoa nasceu 
há menos de um ano, a idade em anos completos é 0) (e esse zero, mesmo calculado, 
é natural). Desse modo é possível calcular a razão entre a idade em anos completos 
de duas pessoas e dizer que uma tem metade da idade da outra. 

De modo geral as diferenças entre categorias de escalas intervalares são “pro- 
movidas” para outro tipo de escala, para as escalas de razão (Seção 5.4), pois no pro- 
cesso do cálculo da diferença um zero natural é introduzido. Por isso que o tempo 
é medido em escala intervalar, mas a duração de um período de tempo (calculado 
como a diferença entre dois pontos no tempo) é medido em escala de razão. 

Outro exemplo: a localização em um plano cartesiano é mensurada em uma 
escala intervalar (a origem do eixo cartesiano pode ser colocada arbitrariamente em 
qualquer lugar do plano), mas a distância de um ponto até a origem é mensurada 
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em escala de razão (pois a mensuração da distância introduz um zero natural: se o 
ponto estiver exatamente sobre a origem, a distância é zero). 


5.4 Escala de razão 


Oúltimo nível na hierarquia de Stevens é a escala de mensuração de razão. Aqui as 
categorias da escala: 


* Podem ser monotonicamente ordenadas, de forma crescente ou decres- 
cente; 


e O intervalo entre duas categorias adjacentes da escala pode ser mensu- 
rado e é sempre constante, ou seja, o intervalo é sempre igual entre quais- 
quer duas categorias adjacentes da escala (mesmo que o intervalo tenha sido 
criado de modo arbitrário), nós sabemos exatamente qual é esse intervalo; e 


e Existe um ponto 0 (zero) absoluto, natural, ou seja, nessas escalas o ponto 
zero existe naturalmente e, portanto, as proporções fazem sentido. 


Alguns exemplos são: peso em quilogramas, altura em centímetros, distância 
em metros, carga elétrica, salário mensal, unidades produzidas, número de filhos de 
um casal, escala Kelvin de temperatura, número de votos que um político recebeu 
na última eleição, nota de um aluno na prova etc. 

Os dados mensurados em escalas de razão podem ser analisados através de todos 
os procedimentos da estatística descritiva (e inferencial, desde que apropriados à 
situação). 

Podem ser representados graficamente, por exemplo, com um histograma, po- 
lígono de frequências, boxplot etc. 


5.5 Resumo das características das escalas e operações 
matemáticas e estatísticas possíveis 


Conforme discutido nas seções anteriores, dados medidos em diferentes escalas 
devem ser analisados e apresentados graficamente por procedimentos diferentes. 

Dados em escala nominal só podem ser apresentados como distribuições de 
frequência ou com gráficos de barra ou pizza, e a única medida de tendência central 
possível é a moda; já os dados mensurados em escala de razão podem ser apresen- 
tados de diversas maneiras e podemos calcular várias medidas de tendência central 
(média, moda, mediana) e de variabilidade (variância, desvio padrão, intervalo in- 
terquartil, percentis, coeficiente de variação). 

A Tabela 1, na página 16, traz um breve resumo dessas diferenças, apontadas 
desde o trabalho de Stevens (1946). Ela não é, de modo algum, exaustiva, mas serve 
como uma primeira orientação para o analista. 
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Tabela 1: Algumas características das escalas de mensuração 


Característica: Nominal Ordinal Intervalar Razão 


Ordenada? / 
Intervalos significativos? 

Zero natural? 

Contagens e distribuição de frequências / 
Moda / 
Mediana 

Média aritmética 

Média geométrica e harmônica 

= É / é 
<, SS, >), E / 
+ — 

X,/ 

Variância e desvio padrão / 
Quantis / / 
Coeficiente de variação 





/ 
/ 


E 
«ES 


«Es 
ES ES EN EN EN EN EN 


Existem ótimas discussões e exemplos de como utilizar as escalas de mensura- 
ção e de como analisar e interpretar esses dados (FEINSTEIN, 1996; FEINSTEIN, 
1987; FEINSTEIN, 1985). 


6 Críticas aos tipos de dados e escalas de men- 
suração 


As escalas de mensuração de Stevens são, talvez, as escalas mais utilizadas hoje 
em dia para entender como um determinado dado foi mensurado, e podem ser en- 
contradas facilmente em diversos livros de estatística (FEINSTEIN, 1977; KLEIN- 
BAUM et al., 1997; TRIOLA, 1998). 

E mesmo amplamente utilizada a hierarquia de escalas de mensuração de Ste- 
vens sofre diversas e amplas críticas por vários teóricos e pesquisadores (VEL- 
LEMAN; WILKINSON, 1993; GAITO, 1984; MICHELL, 1986; GAITO, 1980; 
TOWNSEND; ASHBY, 1984; MacRAE, 1988), principalmente em relação à pres- 
crição de técnicas e procedimentos estatísticos que podem/devem ser utilizados 
dependendo da escala de mensuração. 

Alguns autores sugeriram outras classificações para os tipos de dados e para 
diferentes hierarquias de escalas de mensuração (por exemplo, o trabalho de Mos- 
teller e Tukey em 1977), mas nenhuma dessas alternativas chegou perto de alcançar 
o nível de sucesso e aceitação da proposta de Stevens. 

E o que fazer na prática? Use as escalas de mensuração de Stevens, sabendo que 
são passíveis de crítica e que não serão adequadas para todas as situações (embora 
o sejam na maioria). Bom senso e estudo é sempre o melhor caminho. 
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7 Tipos de dados x Escalas de mensuração 


Já temos agora todo o conhecimento necessário para acabar com a confusão semân- 
tica entre os tipos de dados e as escalas de mensuração. Veja a figura a seguir: 


Figura 3: Relação entre tipos de dados e escalas de mensuração 
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Os dados qualitativos podem ser mensurados em escala nominal (por exem- 
plo, sexo: masculino e feminino) ou em escala ordinal (por exemplo, grau de satis- 
fação: excelente, bom, médio, ruim, péssimo). 

Os dados quantitativos discretos podem ser mensurados em escala intervalar 
(por exemplo, tamanho de sapato: 40, 41, 42) ou em escala de razão (por exemplo, 
número de filhos de um casal: 0, 1, 2). 

Os dados quantitativos contínuos podem ser mensurados em escala intervalar 
(por exemplo, temperatura em graus Celsius: 25,8ºC) ou em escala de razão (por 
exemplo, altura em centímetros: 185,2 cm). 

Um conceito é o tipo de dado, o outro é a escala de mensuração. São relacio- 
nados mas distintos. 

Se você puder escolher, prefira dados em escala de razão: são os mais informa- 
tivos e podem ser transformados facilmente para uma escala ordinal, se necessário. 
Por exemplo: se você tem o peso em quilogramas (dado quantitativo contínuo em 
escala de razão) pode “transformá-lo” facilmente em um dado qualitativo em escala 
ordinal (magro, normal ou gordo), apenas definindo-se pontos de corte na escala. 
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8 Outras escalas 


Por fim, gostaria de chamar a atenção para o fato de que essas não são as únicas 
escalas possíveis. 

É possível, por exemplo, combinar várias escalas ordinais e criar uma escala 
quase perfeitamente numérica, chamada de escala quasi-numérica ou quasi-dimensional 
(FEINSTEIN, 1987; FEINSTEIN, 1985). Um exemplo é a famosa Escala de Apgar 
para a avaliação clínica imediata do bebê recém-nascido (APGAR, 1953). 

Outras escalas quasi-dimensionais podem ser obtidas através de procedimentos 
interessantes, como as escalas diferenciais gráficas (por exemplo, as escalas visu- 
ais analógicas) (FEINSTEIN, 1985) e semânticas (por exemplo, escalas categóricas 
psicossociais) (FEINSTEIN, 1987). 

Escalas especializadas também são utilizadas em marketing, pesquisas de opi- 
nião e em diversas áreas. 

Não cabe nesta revisão de tipos de dados e escalas de medida uma discussão a 
respeito dessas escalas especializadas. O leitor interessado tem à disposição bas- 
tante material de estudo na Internet. 
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